Explainable AI (XAI) is widely viewed as a sine qua non for ever-expanding AI research. A better understanding of the needs of XAI users, as well as human-centered evaluations of explainable models are both a necessity and a challenge. In this paper, we explore how HCI and AI researchers conduct user studies in XAI applications based on a systematic literature review. After identifying and thoroughly analyzing 85 core papers with human-based XAI evaluations over the past five years, we categorize them along the measured characteristics of explanatory methods, namely trust, understanding, fairness, usability, and human-AI team performance. Our research shows that XAI is spreading more rapidly in certain application domains, such as recommender systems than in others, but that user evaluations are still rather sparse and incorporate hardly any insights from cognitive or social sciences. Based on a comprehensive discussion of best practices, i.e., common models, design choices, and measures in user studies, we propose practical guidelines on designing and conducting user studies for XAI researchers and practitioners. Lastly, this survey also highlights several open research directions, particularly linking psychological science and human-centered XAI.
translated by 谷歌翻译
Data deprivation, or the lack of easily available and actionable information on the well-being of individuals, is a significant challenge for the developing world and an impediment to the design and operationalization of policies intended to alleviate poverty. In this paper we explore the suitability of data derived from OpenStreetMap to proxy for the location of two crucial public services: schools and health clinics. Thanks to the efforts of thousands of digital humanitarians, online mapping repositories such as OpenStreetMap contain millions of records on buildings and other structures, delineating both their location and often their use. Unfortunately much of this data is locked in complex, unstructured text rendering it seemingly unsuitable for classifying schools or clinics. We apply a scalable, unsupervised learning method to unlabeled OpenStreetMap building data to extract the location of schools and health clinics in ten countries in Africa. We find the topic modeling approach greatly improves performance versus reliance on structured keys alone. We validate our results by comparing schools and clinics identified by our OSM method versus those identified by the WHO, and describe OSM coverage gaps more broadly.
translated by 谷歌翻译
临床笔记是健康记录的重要组成部分。本文评估了如何使用自然语言处理(NLP)来确定肿瘤患者急性护理使用(ACU)的风险,一旦化疗开始。使用结构化健康数据(SHD)的风险预测现在是标准的,但是使用自由文本格式的预测很复杂。本文探讨了自由文本注释用于预测ACU而不是SHD的使用。将深度学习模型与手动设计的语言功能进行了比较。结果表明,SHD模型最少胜过NLP模型。具有SHD的L1型逻辑回归的C统计量为0.748(95%-CI:0.735,0.762),而具有语言功能的相同模型达到0.730(95%-CI:0.717,0.745)和基于变形金属的模型模型达到了0.702(95%-CI:0.688,0.717)。本文展示了如何在临床应用中使用语言模型,并强调了不同患者群体的风险偏见如何不同,即使仅使用自由文本数据。
translated by 谷歌翻译
腿部运动中的弹簧基于弹簧的执行器可提供能量效率和提高的性能,但增加了控制器设计的难度。尽管以前的作品集中在广泛的建模和模拟上,以找到此类系统的最佳控制器,但我们建议直接在真实机器人上学习无模型控制器。在我们的方法中,步态首先是由中央模式发电机(CPG)合成的,其参数被优化以快速获得可实现有效运动的开环控制器。然后,为了使该控制器更强大并进一步提高性能,我们使用强化学习来关闭循环,以在CPG之上学习纠正措施。我们评估了DLR弹性四足动物BERT中提出的方法。我们在学习小跑和前进步态方面的结果表明,对弹簧执行动力学的开发自然而然地从对动态运动的优化中出现,尽管没有模型,但仍会产生高性能的运动。整个过程在真正的机器人上不超过1.5小时,并导致自然步态。
translated by 谷歌翻译
神经网络是众多远期过程的强大代孕。这种代理人的反转在科学和工程中非常有价值。成功的神经反向方法的最重要属性是在现实世界中(即在本地远期过程(不仅是学识渊博的替代)中部署在现实世界中时的解决方案的性能。我们建议自动化,这是一种高度自动化的神经网络代理的方法。我们的主要见解是在可靠数据附近寻求反向解决方案,这些解决方案已被取样形式,并用于训练替代模型。自动信息通过考虑替代物的预测不确定性并在反转过程中最小化,从而找到了这种解决方案。除了高精度外,自动验证液可以实现溶液的可行性,并带有嵌入式正规化,并且不含初始化。我们通过解决控制,制造和设计中的一系列现实世界问题来验证我们的方法。
translated by 谷歌翻译
神经塌陷是指表征类嵌入和分类器重量的几何形状的显着结构特性,当经过零训练误差以外的训练时,深网被发现。但是,这种表征仅适用于平衡数据。因此,我们在这里询问是否可以使阶级失衡不变。为此,我们采用了不受限制的功能模型(UFM),这是一种用于研究神经塌陷的最新理论模型,并引入了单纯形编码标签的插值(SELI)作为神经崩溃现象的不变特征。具体而言,我们证明了UFM的跨凝结损失和消失的正则化,无论阶级失衡如何,嵌入和分类器总是插入单纯形编码的标签矩阵,并且其单个几何形状都由同一标签矩阵矩阵矩阵的SVD因子确定。然后,我们对合成和真实数据集进行了广泛的实验,这些实验确认了与SELI几何形状的收敛。但是,我们警告说,融合会随着不平衡的增加而恶化。从理论上讲,我们通过表明与平衡的情况不同,当存在少数民族时,山脊规范化在调整几何形状中起着至关重要的作用。这定义了新的问题,并激发了对阶级失衡对一阶方法融合其渐近优先解决方案的速率的影响的进一步研究。
translated by 谷歌翻译
在各种领域,包括搜索和救援,自动驾驶汽车导航和侦察的各个领域,形成不断变化的场景的非线图像(NLOS)图像的能力可能具有变革性。大多数现有的活性NLOS方法使用针对继电器表面并收集回返回光的时间分辨测量的脉冲激光来照亮隐藏场景。流行的方法包括对垂直壁上的矩形网格的栅格扫描,相对于感兴趣的数量,以产生共聚焦测量集合。这些固有地受到激光扫描的需求的限制。避免激光扫描的方法将隐藏场景的运动部件作为一个或两个点目标。在这项工作中,基于更完整的光学响应建模,但仍没有多个照明位置,我们演示了运动中对象的准确重建和背后的固定风景的“地图”。计数,本地化和表征运动中隐藏物体的大小,结合固定隐藏场景的映射的能力,可以大大提高各种应用中的室内情况意识。
translated by 谷歌翻译
过度参数化模型即使与传统的减轻失衡技术结合使用,在存在数据失衡的情况下也无法很好地概括。本文着重于分类数据集,其中一小部分人口(少数​​)可能包含与类标签相关的功能。对于跨凝结损失修饰和代表性高斯混合模型的参数家族,我们在最严重的组误差上得出了非反应泛化的边界,该误差揭示了不同的超参数的作用。具体而言,我们证明,在适当调整后,最近提出的VS-Loss学会了一个模型,即使伪造的特征很强,也对少数群体也是公平的。另一方面,替代性启发式方法,例如加权CE和LA-loss,可能会急剧失败。与以前的作品相比,我们的界限适用于更多的通用模型,它们是非吸血管的,即使在极端不平衡的情况下,它们也适用。
translated by 谷歌翻译
固有频率的降低通常用作结构健康监测(SHM)目的的损坏指标。但是,操作和环境条件的波动,边界条件的变化以及名义相同结构之间的微小差异也会影响刚度,从而产生模仿或掩盖损坏的频率变化。这种可变性限制了SHM技术的实际实施和概括。这项工作的目的是研究正常变异的效果,并确定解释产生不确定性的方法。这项工作考虑了从四个健康的全尺度复合直升机叶片收集的振动数据。叶片名义上是相同的,但叶片是不同的,并且叶片之间的材料特性和几何形状略有差异,导致频率响应函数的显着差异,这是整个输入空间中四个独立的轨迹。在本文中,使用高斯工艺(OMGP)的重叠混合物来生成标签并量化直升机叶片的正常条件频率响应数据的不确定性。使用基于人群的方法,OMGP模型提供了称为形式的通用表示形式,以表征叶片的正常状况。然后将其他模拟数据与该形式进行比较,并使用边缘样式新颖性指数评估损伤。
translated by 谷歌翻译
视频框架插值(VFI)实现了许多可能涉及时间域的重要应用程序,例如慢运动播放或空间域,例如停止运动序列。我们专注于以前的任务,其中关键挑战之一是在存在复杂运动的情况下处理高动态范围(HDR)场景。为此,我们探索了双曝光传感器的可能优势,这些传感器很容易提供尖锐的短而模糊的长曝光,这些曝光是空间注册并在时间上对齐的两端。这样,运动模糊会在场景运动上暂时连续的信息,这些信息与尖锐的参考结合在一起,可以在单个相机拍摄中进行更精确的运动采样。我们证明,这促进了VFI任务中更复杂的运动重建以及HDR框架重建,迄今为止仅考虑到最初被捕获的框架,而不是插值之间的框架。我们设计了一个在这些任务中训练的神经网络,这些神经网络明显优于现有解决方案。我们还提出了一个场景运动复杂性的度量,该指标在测试时间提供了对VFI方法的性能的重要见解。
translated by 谷歌翻译